查看原文
其他

爬虫|爬取全国中小学电脑制作活动技术讲座视频

陈鸥辉 信息科技时代 2024-03-15


通过查看源文件可以看到如下三个视频的地址:

    将地址一一复制到代码中,就可以下载视频了,请注意尊重原创,保护知识产权,所以我只爬了一个视频示例,另两个请打开“阅读原文”查阅,也可以自行下载查看:

参考代码:

import requests
url = 'http://huodong2000.ncet.edu.cn/video/v/shaierbiancheng.mp4'
fname=url.split('/')[-1]#取文件名
with requests.get(url, stream=True) as r:
print('开始下载:')
content_size = int(r.headers['content-length'])
with open(fname, 'wb')as f:
n = 1
for i in r.iter_content(chunk_size=1024):
loaded = n * 1024.0 / content_size
f.write(i)
print('已下载{0:%}'.format(loaded))
n += 1
print('下载结束')

    本来想爬NOI网站上的视频,但是对方设置了禁止下载,所以这个代码是爬取不成功的,如果人家不让下载尽量不要爬取,这个文件我一试就爬下来了。

爬虫相关文章

第五章 数据处理和可视化表达的学习中国爬虫违法违规案例汇总关于爬虫的合法性爬虫的基本原理
使用BeautifulSoup解析网页及清洗数据
推荐|Python 爬虫系列教程一爬取批量百度图片爬虫|python读写csv文件的方法完成生涯规划表爬虫|以豆瓣为例简单地介绍爬取网站数据的方法爬虫|以豆瓣为例简单地介绍清洗数据的方法
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存